Практикум 7. Uniprot и Refseq Protein

1)Таблица с информацией о белке:

Uniprot IDO66728_AQUAE
Uniprot ACO66728
Refseq IDNP_213288.1; WP_010880226.1
PDB ID1VFG; 4WBY; 4WBZ; 4WC0; 4WC1; 4WC2; 4WC3; 4WC4; 4WC5; 4WC6; 4WC7; 4X0A; 4X0B
Длина в аминокислотных остатках824
Молекулярная масса в Дальтонах94658
Рекомендуемое Unirpot названиеECO:0000313; EMBL:AAC06692.1

Данный белок является поли-а-полимеразой, выделенной из термофильной бактерии Aquifex aeolicus . Его последовательность можно посмотреть по этой ссылке.

2)UniRef позволяет найти белки со сходной последовательностью (100%, 90%, 50% сходства). Описание кластеров UniRef приведено ниже:

3)Отчет по поиску:

Дополнительное задание:

4)Запись RefSeq менее подробна. В ней нет многой информации, например, указаний на идентификаторы в других базах даных и PDB файлы, молекулярной массы, подробного описания функций. Информация о таксономическом положении организма и сама последовательность белка присутствует. Также в RefSeq можно прочитать о сайтах связывания и краткий комментарий к содержанию статьи.

5)Изучение истории записи P05177(Cytochrome P450 1A2 человека): данная запись появилась в 11 января 1988 года под названием Q16754. Всего было 173 изменений. Последнее датируется 13 апреля 2016 года, однако сама последовательность полипептида (версия 3) не изменялась с 23 января 2007 года.

6)Метилирование, ацетилирование и фосфорилирование отмечаются как MOD_RES в разделе FT; наличие ионов металла как METAL в том же отделе; гликозилирование отмечается как CARBOHYD в разделе FT; дисульфидные связи - DISULFID в разделе FT; альтернативный сплайсинг - VAR_SEQ; варианты аминокислот в позиции - VARIANT Х1 -> Х2 (Х1, Х2 - варианты аминокислоты); селеноцистеин обозначается как U, пирролизин как O


© Борисов Евгений 2016